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(54) Bezeichnung: Einrichtung der programmierbaren Logik 

(57) Zusammenfassung: Die Einrichtung (7) der program- 
mierbaren Logik umfasst me h re re Logikblflcke (3A bis 3D) 
mit konfigurierbaren Eigenschaften und Mittel zum Ver- 
knupfen der Logikblocke untereinander und mit einer Ver- 
arbeitungseinheit (4) und einer Ein-/Ausgabeeinheit (5). 
Eine Rekonfigurierbarkeit der Logikblocke (3A bis 3D) w£h- 
rend des Betriebs der Logikeinrichtung (7) ist dadurch ge- 
geben, dass die Verknupfungsmittel zusatzlich wenigstens 
einen konfigurierbaren Umschalt-Logikblock (8) aufweisen, 
mit demdie Konfiguration wenigstens einiger der rekonfigu- 
rierbaren Logikblocke (3A bis 3D) untereinander und/oder 
mit der Verarbeitungseinheit (4) und/oder der Ein-/Ausga- 
beeinheit (5) erfolgt. 
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Beschreibung 

[0001] Die Erfindung bezieht sich auf eine Einrich- 
tung der programmierbaren Logik mit mehreren Lo- 
gikblOcken mit konfigurierbaren Eigenschaften, die 
jeweils mindestens eine logische Verarbeitungsein- 
heit mit Funktionsprogrammen und Schnittstellen zu 
den jeweils anderen LogikblOcken umfassen, mit 
mindestens einer den Logikblocken zugeordneten 
Eingabe- und Ausgabeeinheit sowie mit Mitteln zum 
Verknupfen der LogikblGcke untereinander, mit der 
mindestens einen Verarbeitungseinheit eines ande- 
ren Logikblocks und mit der mindestens einen 
Ein-/Ausgabeeinheit. Eine derartige Logikeinrichtung 
ist der US 4,870,302 A zu entnehmen. 
[0002] Programmierbare logische Bausteine von 
herkdmmlichen Logikeinrichtungen wie insbesonde- 
re Prozessoren fuhren Programme aus, die aus ei- 
nem Speicher geladen werden. Die auszufOhrende 
Software in Form von Befehlswortern ist dort als Ma- 
schinenbefehl abgelegt. Diese BefehlswGrter werden 
geladen, analysiert, interpretiert und in einer Verar- 
beitungseinheit ausgefuhrt. Dabei lost die Verarbei- 
tung eines einzigen Befehlswortes eine Vielzahl von 
Einzelaktionen in der Logikeinrichtung aus. 
[0003] Die Basisstruktur und -organisation bekann- 
ter digitaler Logikeinrichtungen, insbesondere von 
Computern mit Mikroprozessoren, beruht auf der 
Konzeption des sogenannten „Von-Neumann-Rech- 
ners". Dessen Zentraleinheit CPU („Central Proces- 
sing Unit"), d.h. dessen Computerkern, umfasst in ih- 
rer Minimalkonfiguration als Hauptbestandteile einen 
Hauptspeicher, eine Steuereinheit und eine Verarbei- 
tungseinheit (bzw. Rechenwerk): 

- Der Hauptspeicher speichert Befehlsworter 
(Programmdaten) und Verarbeitungsdaten (Ope- 
rantenworter) und stellt diese auf Aufforderung 
zur Verfugung. Ferner nimmt der Hauptspeicher 
Zwischen- und Endresultate der Verarbeitung auf. 
Hauptspeicher konnen durch fluchtige oder 
nicht-fluchtige Speicher realisiert werden. 

- Die Steuereinheit organisiert die Reihenfolge, in 
der Befehlsworter abgearbeitet werden. Sie for- 
dert Befehlswdrter aus dem Hauptspeicher an 
und veranlasst deren Ausfuhrung in der Verarbei- 
tungseinheit. AuSerdem analysiert sie die Be- 
fehlsworter und veranlasst die Lieferung von Ver- 
arbeitungsdaten an die Verarbeitungseinheit. 

- Die Verarbeitungseinheit fuhrt die Operation an 
den Verarbeitungsdaten aus und liefert entspre- 
chende Resultatwdrteran den Hauptspeicher. Fur 
jede Operation enthait die Verarbeitungseinheit 
ein Mikroprogramm, das die benOtigten Ubertra- 
gungswege freischaltet. Die Verarbeitungseinheit 
wird durch die Steuereinheit auf die jeweilige Ope- 
rationsart, d.h. auf den abzuarbeitenden Befehl, 
eingestellt. 

[0004] Der Zentraleinheit sind Peripheriegerate zu- 
geordnet, bei denen es sich um externe Speicher so- 



wie urn Ein- und Ausgabegerate handeln kann. Die 
angegebenen Hauptkomponenten der Zentraleinheit 
konnen physikalisch getrennt sein; zumeist sind sie 
jedoch auf einem gemeinsamen Prozessorchip mit 
einem Cache Oder beispielsweise einem embedded 
ROM realisiert. 

[0005] Eine genauere Betrachtung der Program- 
mierung einer solchen programmierbaren Logikein- 
richtung PLD ^Programmable Logic Device") mit den 
erwahnten Grundkomponenten des Von-Neumann 
Rechners zeigt, dass das Programm sowie die Initia- 
lisierungsdaten im preiswerten Speicher (mit minimal 
1 Transistor pro Speicherzelle) untergebracht sind 
und erst dann in die CPU zur Ausfuhrung gelangen, 
wenn sie an der Reihe sind. Die preiswerte Speiche- 
rung einerseits und die „Wiederverwendung" der auf- 
wendigeren CPU-Schaltkreise wie ALU (.Arithmetic 
Logic Unit") fur alle moglichen Instruktionen anderer- 
seits sind die positiven Beitrage zu einer sogenann- 
ten „funktionalen Dichte" der Prozessor-basierten 
Rechner. Hierbei ergibt die zeitliche Sequenz der Be- 
arbeitung naturlich einen negativen Beitrag. 
[0006] Die funktionale Dichte kann dabei als mittlere 
Anzahl von aktiven Gatteraquivalenten pro Silizium- 
fiache und Zeit definiert werden. 
[0007] Bei bekannten programmierbaren Logikein- 
richtungen (PLDs) mit Rechenkapazitat, Speicher 
und Ein- und Ausgabeeinheit I/O („lnput/Output"), wie 
sie z.B. aus der eingangs genannten US-A-Schrift zu 
entnehmen ist, wird deren Struktur einmal program- 
miert, und der Programm-(wie Daten-)lnhalt wird an 
der Struktur selbst gespeichert. Diese Form der Spei- 
cherung ist aufwendig, denn um den Speicher selbst 
mussen zwecks schneller Umsetzung in geschaltete 
Datenpfade eine Menge von zusatzlichen Transisto- 
ren hinzukommen. Es existieren zwar nur wenige An- 
gaben uber die Ausnutzung des Siliziums; man sollte 
von Faktoren 20 bis 40 im Verhaltnis Gesamt- 
zahl/sichtbarer Transistorkapazitat (im Sinne der 
Schaltfunktion) ausgehen. Bei der bekannten Aus- 
fuhrungsform einer Logikeinrichtung bezieht sich die 
Verknupfung ihrer LogikblGcke erstens auf die Kopp- 
lung von Datenausgangen auf Dateneingange (Rou- 
ting-Verknupfung) und zweitens auf die Verarbeitung 
der Eingangsdaten zu den Ausgangsdaten in den 
einzelnen LogikblGcken (Logik-Verknupfung). Die 
Routing-Verknupfung gilt sowohl fur Daten, die aus 
Logikblbcken (Logic Elements) stammen bzw. in die- 
se gefuhrt werden, als auch fur solche, die aus 
l/O-Pads stammen bzw. in diese geleitet werden. Es 
ist ausschlie&lich an eine Datenkopplung in diesem 
System gedacht. 

[0008] Aus der US 6,333,641 B1 geht eine program- 
mierbare Logikeinrichtung mit einem Array von Lo- 
gikmodulen oder -blacken hervor. Eine Verbindungs- 
einheit mit vertikalen Routing(Leitweg-)Bahnen, hori- 
zontalen Routing-Bahnen und lokalen Routing-Bah- 
nen verknOpft die Logikblocke. Ein Omni-(universel- 
ler)Bus (Datenaustauschsammelschiene) ist uber 
das Array gelegt, der mit dem Array derart verknupft 
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ist, dass dieser dynamisch selbstandige Sub-Arrays 
der Logikbldcke mit variabler GrdiJe bildet, die ihrer- 
seits mit dem Omni-Bus verbunden sind. Die Ver- 
knupfung ist dabei von vornherein festgelegt. Auch 
hier handelt es sich wie im Fall der US 4,870,302 A 
um Datenverbindungen, d.h. um einen Austausch 
von Daten. 

[0009] Da die Programmierbarkeit in Form eines 
Speichers mit Umsetzung in geschaltete Datenpfade 
recht teuer ist, wie im Fall des Rechners aber bislang 
das komplette Programm im Baustein lagert, errei- 
chen die PLDs trotz Potenzials fur hohe funktionale 
Dichte „nur" den Faktor 10 mehr als Prozessoren. 
Das bedeutet, dass der Geschwindigkeitsgewinn in 
PLDs gegenOber Prozessorldsungen teuer erkauft 
ist. 

[0010] Aufgabe der vorliegenden Erfindung ist es 
deshalb, die programmierbare Logikeinrichtung mit 
den eingangs genannten Merkmalen dahingehend 
auszugestalten, dass bei hoher funktioneller Dichte 
eine hohe Geschwindigkeit des PLDs mit einfachen 
Mitteln zu erreichen ist. 

[0011] Diese Aufgabe wird erfindungsgemaS mit 
den in Anspruch 1 angegebenen MaGnahmen geldst. 
Diese Ma&nahmen umfassen eine Rekonfigurierbar- 
keit der Logikbldcke wdhrend des gesamten Betriebs 
der Logikeinrichtung dadurch, dass die Verknup- 
fungsmittel zusStzlich wenigstens einen konfigurier- 
baren Umschalt-Logikblock aufweisen, mit dem eine 
Konfiguration wenigstens einiger der rekonfigurierba- 
ren Logikbldcke selbst und/oder ihrer Verbindungen 
untereinander und/oder ihrer Verbindungen mit der 
Verarbeitungseinheit und/oder ihrer Verbindungen 
mit der Ein-/Ausgabeeinheit erfolgt, wobei der Um- 
schalt-Logikblock in einer Ebene ausgebildet ist, die 
von einer Ebene mit den rekonfigurierbaren Logikbld- 
cken verschieden ist. Unter einer verschiedenen 
Ebene des Umschalt-Logikblocks wird dabei jede 
Ebene verstanden, die nicht gleichzeitig die Ebene 
der rekonfigurierbaren Logikbldcke ist. D.h., die Ebe- 
ne des Umschalt-Logikblocks kann Ober, neben oder 
unter der Ebene der rekonfigurierbaren Logikbldcke 
liegen. 

[0012] Die mit einer solchen Architektur verbunde- 
nen Vorteile sind insbesondere darin zu sehen, dass 
bei begrenzter Anzahl von nunmehr rekonfigurierba- 
ren Logikbldcken neben einer Konfiguration der Bld- 
cke selbst auch die Verbindungen zwischen diesen 
Bldcken und/oder zu externen Bausteinen wie Spei- 
chereinheiten oder Mikroprozessoren wie z.B. zu der 
Verarbeitungseinheit und/oder zu der Ein-/Ausgabe- 
einheit nicht ein fur alle Male fest vorgegeben sind, 
sondern dass diese Verbindungen mit Hilfe des zu- 
satzlich vorgesehenen Umschalt-Logikblocks w£h- 
rend des gesamten Betriebs bedarfsma&ig erstellt, 
d.h. konfiguriert werden kdnnen. Eine derartige Kon- 
figuration mittels des Umschalt-Logikblocks kann als 
eine Verknupfungsoperation der erfindungsgemafc 
ausgestalteten Verknupfungsmittel angesehen wer- 
den. 



[0013] Die Konfiguration kann dabei jederzeit, d.h. 
wahrend der gesamten, ununterbrochenen Betriebs- 
dauer - also nicht nur wShrend einer Start- oder 
Boot-Phase - vorgenommen werden. Die erfindungs- 
gemSGen MaGnahmen bedeuten also eine Verbin- 
dung von dem Umschalt-Logikblock zu Verknup- 
fungsbereichen und damit zu einer entsprechenden 
Konfiguration derselben. Damit wird es ermdglicht, 
dass von einzelnen Bldcken unterschiedliche Funkti- 
onen zu unterschiedlichen Zeitpunkten auszufuhren 
sind; d.h., deren Ausnutzung wird entsprechend er- 
hdht. Damit verbunden ist eine entsprechende Per- 
formance-Verbesserung der gesamten Logikeinrich- 
tung, verglichen mit einem Mikroprozessor, bzw. kein 
Performance-Verlust im Vergleich zu herkdmmlichen 
PLDs. 

[0014] PLDs erhalten - wie von-Neumann-Prozes- 
soren - zwei Arten von Informationen, Code und Da- 
ten. Der Code, der grundsatzlich die Aktionswoche 
bestimmt und bei PLDs Konfiguration bzw. Konfigu- 
rationscode genannt wird, wird ublicherweise vor 
dem eigentlichen Betrieb geladen und ist dann wSh- 
rend des Betriebs unveranderlich. Die Konfiguration 
bestimmt u.a. die im Baustein aktiven Verbindungen. 
[0015] Die Daten kdnnen sich wahrend des Betriebs 
verandern und dadurch auch den aktuelien Verlauf 
der Operationen beeinflussen. Wahrend also der 
Code alle mdglichen Wegen beinhaltet, wird die tat- 
sachliche Nutzung - dies entspricht dem aktueil 
durchlaufenden Pfad - (auch) von den Daten be- 
stimmt. 

[00 1 6] Der Umschalt-Logikblock nach der Erfindung 
erhait ebenfalls Code und Daten. Das Wesentliche 
der Erfindung besteht nun darin, die ubrigen, 
Nicht-Umschalt-PLDs, zu steuern, und zwar durch 
Wechseln bzw. Modifizieren des Codes. 
[001 7] Bei dem genannten Stand der Technik sowie 
bei den in der Praxis ublichen PLDs werden konfigu- 
rierbare Bldcke dadurch miteinander verbunden, 
dass die (Laufeeit-variablen) Daten austauschbar 
sind, also etwa in der Form, dass Datenausgange 
des einen Blocks mit DateneingSngen des anderen 
verbunden sind. Bei dem erfindungsgemSRen Um- 
schalt-Logikblock ist es jedoch so, dass die Ausgan- 
ge dieses Logikblocks zumindest partiell an den in 
anderen Ausfuhrungsformen im Betrieb unzugangli- 
chen Codebereich der konfigurierbaren Logikbldcke 
angeschlossen sind. Demgegenuber bezieht sich der 
Stand der Technik auf Ausfuhrungsformen, bei denen 
die konfigurierbaren Logikbldcke im Datenpfad kop- 
peln, nicht jedoch auf den Code Einfluss haben. 
[00 1 8] Vorteilhafte Ausgestaltungen der erfindungs- 
gema&en Logikeinrichtung gehen aus den abhSngi- 
gen Anspruchen hervor. 

[0019] So kann insbesondere die Konfiguration we- 
nigstens einiger der rekonfigurierbaren Logikbldcke 
einem vorgegebenen Kontext entsprechend erfol- 
gen. 

[0020] Ferner kann vorteilhaft der Umschalt-Logik- 
block wenigstens einen Zustandsspeicher aufwei- 
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sen, der Informationen bezuglich der Funktionen der 
einzelnen rekonfigurierbaren Logikblocke enthait, so 
dass die Konfiguration der ausgewahlten rekonfigu- 
rierbaren Logikblocke gemaR den Funktionsinforma- 
tionen des aktuellen Zustands erfolgt. 
[0021] Die den erfindungsgemafcen MaRnahmen zu 
Grunde liegenden Oberlegungen werden nachfol- 
gend unter Bezugnahme auf die Zeichnung noch wei- 
ter erlautert Dabei zeigen 

[0022] deren Fig. 1 die Grundstrukturen von vier 
einfachen, bekannten Automatentypen, 
[0023] deren Fig. 2 die Grundstruktur einer soge- 
nannten ..Sequential Finite State Machine", 
[0024] deren Fig. 3 den schematischen Aufbau ei- 
ner partiell rekonfigurierbaren PLD 
[0025] und deren Fig. 4 den schematischen Aufbau 
einer erfindungsgema&en Logikeinrichtung. 
[0026] Im Folgenden werden aus den Maschinen 
vom sogenannten ..Finite State"-Typ die sogenannten 
..Sequential Finite State Machines" (SFSM) abgelei- 
tet. Das hierfur aufgezeigte Modell ist dazu geeignet, 
eine Sequenz von Konfigurationen im PLD zu definie- 
ren, und genau diese Sequenz kann ohne Perfor- 
mance-Verlust eine wesentlich hdhere funktionale 
Dichte (gleichbedeutend mit drastisch gesenkten 
Kosten fur Herstellung und Betrieb) eines PLDs er- 
zeugen. 

Abschnitt I (..Sequential Finite State Machines") 

[0027] Eines der ..klassischen" Denkmodelle fur 
eine Hardwareentwicklung besteht in den einfachen 
endlichen Automaten. im Folgenden ..Finite State 
Machines" (FSM) genannt. 

[0028] Dieses eng mit theoretischen Konzepten 
(insbesondere des sogenannten ..Deterministischen 
endlichen Automaten") verwandte Modell ist exakt 
wie folgt definiert: 

Definition 1: 

[0029] Eine FSM besteht aus einem 6-Tupel {A, X, 
Y, f, g, a 0 }. 

A = {a 0 , a 1f ... a M } ist hierbei die endliche Menge der 
Zustande, wobei a 0 den Startzustand bedeutet. 
X = {X v .. XJ ist die endliche Menge der Eingangs- 
vektoren mit X, = (x 1f .. x L )j, wobei e {0, 1 , -}. 
Y = {Y 1f .. Y N } ist die endliche Menge der Ausgangs- 
vektoren mit Yj = (y^ ... y H ) jf wobei y h e {0, 1, -}. 
f : A * X A heifct Transitionsfunktion (Next State De- 
coder), 

g: A * X -* Y heifct Ausgangsfunktion (Output Deco- 
der), t = Zeiteinheit. 

[0030] Die in dieser Definition genannten Funktio- 
nen werden durch Schaltnetze realisiert, die den al- 
gorithmischen Zusammenhang zwischen den (im 
Wesentlichen binSren) Eingangs- und Zustandsvek- 
toren darstellen. Hierzu ist allerdings notwendig, 
dass auch die Zustande bindr codiert werden, was in 
Definition 1 noch nicht der Fall war. 



[0031] Fur die Zustandsautomaten werden weiter- 
hin drei wesentliche Untertypen (siehe Fig. 1) unter- 
schieden, deren Einfluss auf die Komplexitat der 
Funktionen in der Praxis gegeben ist. Ein Entwickler 
wird folgende Schritte durchfuhren: 

1. Festlegen der Signale: Das Schaltwerk wird als 
..Black Box" mit den erforderlichen Eingangs- und 
Ausgangssignalen skizziert. 

2. Entwerfen des Zustandsdiagramms: Dieser 
Schritt ist der eigentliche Kern der Synthese, da 
hier das zu lOsende Problem formal beschrieben 
wird. Als Zustandsdiagramm sind Zustandsgra- 
phen, Programmablaufplane oder auch Schalt- 
werktabellen mdglich. 

3. Aufstellen der Schaltwerktabelle als formaler 
Ausgangspunkt fur alle weiteren Operationen. 

4. Zustandsminimierung: Die Minimierung der An- 
zahl der Zustande soli eine Vereinfachung des 
Designs erreichen. 

5. Zustandscodierung: Bei synchronen Schaltwer- 
ken mit synchronisierten Eingangen (nicht fur Me- 
aly-Automat gemafc Fig. 1d) lassen sich beliebige 
Codierungen fur die Zustande aus Z angeben. 
Beim Medwedjew-Automat gemafc Fig. 1b mus- 
sen die Codierungen allerdings mit den ge- 
wiinschten Ausgangssignalen ubereinstimmen; 
beim Moore-Automat gemSU Fig. 1c hingegen 
konnen die Codierungen so gewahlt werden, dass 
sich vereinfachte Schaltnetze fur Next State De- 
coder (f) und Output Decoder (g) ergeben. 

6. Berechnung von Folgezustands- und Aus- 
gangsschaltnetzen: 

Zur konkreten Berechnung des Folgezustands- 
schaltnetzes muss ein Register- bzw. Flipfloptyp 
gewahlt werden, da deren Eingange (T, D, RS 
oder JK) durch dieses Schaltnetz belegt werden, 
aber unterschiedliche Funktionalitaten zeigen. 

7. Realisierung des Schaltwerks und Test 

[0032] Aus der Praxis weiG man nun, dass die Imp- 
lementierung als einfache Maschine - man kbnnte 
sie auch als ..flache Maschine" bezeichnen - nicht un- 
bedingt die beste ist. Ein kooperierender Automat, 
bestehend aus mehreren einfachen Automaten, die 
miteinander gekoppelt sind, kann dies haufig wesent- 
lich besser im Sinne von fiacheneffizienter. Zudem 
sollte bedacht werden, dass der vorstehend skizzier- 
te Designfluss nicht unbedingt in der angegebenen 
Weise durchgefuhrt werden muss. Gerade mit zu- 
nehmender Beschreibung in Hochsprachen wie 
VHDL ist eine Hinwendung zu mehr algorithmischem 
Stil zu erkennen. 

[0033] Unabhangig davon soil jedoch die FSM als 
das grundlegende Modell angenommen werden. 
Man kann sich nun vorstellen, nicht nur eine FSM zu 
haben, sondern mehrere, von denen exakt eine zu ei- 
nem Zeitpunkt aktiv ist. Ein ausgezeichneter Teil (der 
sogenannte ..Sequencer") schaltet dann in Abhangig- 
keit von Eingangssignalen oder erreichten Resulta- 
ten zwischen den einzelnen FSMs um. 
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[0034] Ausgehend von dieser FSM wird nachfol- 
gend die Sequential Finite State Machine (SFSM) 
korrekt definiert und dargestellt 

Definition 2: 

[0035] Eine Sequential Finite State Machine 
(SFSM) besteht aus einem 5-Tupel (B, B 0> C, V, h) . 
Hierbei stellt B = {B 0 , ... BJ eine endliche Menge von 
Finite State Machines (FSM) dar, B 0 ist die 
Start-FSM. C = {C 0f ... CJ beschreibt eine endliche 
Menge von Zustanden zur Kenntlichmachung der ak- 
tuellen FSM. V = {V^.. V N } ist die endliche Menge der 
(zusatzlichen) Eingangsvektoren mit V, = (v 1? ... v L ) jt 
wobei ^€{0,1,-}. h:BxV-»B heiRt FSM-Transiti- 
onsfunktion (Next FSM Decoder). 
[0036] Der wesentliche Vorteil dieser SFSM (vgl. 
hierzu auch Fig. 2) liegt erst einmal in der Modellie- 
rung. Ein Designer hat die Chance, sein Design in 
kleinere Portionen zu teilen. In der technischen Aus- 
fuhrung wird man dann versuchen, die (weiterhin 
endliche) Menge der Zustande aus alien FSMs B k auf 
eine einheitliche Zustandscodierung abzubilden. Zu- 
satzlich hierzu muss eine Codierung fur die C k der ak- 
tuellen FSM B k mitgefuhrt werden, urn fur die Funkti- 
on h die Berechnung der nachsten FSM zu ermogli- 
chen. 

[0037] Andererseits zeigt ein Blick auf Fig. 2, dass 
eigentlich nur wenig gewonnen ist. Falls der Takt fur 
alle Register identisch ist, dann wurden in Fig. 1a die 
Register und das Schaltnetz f(u*. x*) (hext State De- 
coder), * bedeutet Gesamtmenge) in Teilmengen von 
Registern mit f(u, x, c) und h(u, v, c) eingeteilt, die in 
der Realisierung wieder zusammengefuhrt werden. 
Minimalerwird die L5sung dadurch kaum, denn in ei- 
nem PLD heutiger Bauart mussen alle Teile, also alle 
Teil-FSM, auf dem Baustein integriert werden. Hier 
setzen nun die erfindungsgemaften Uberlegungen 
an. 

[0038] Es existieren zwar wenige FPGAs 
(„Fie!d-Programmable Gate Arrays"; vgl. z.B. „Spek- 
trum der Wissenschaft", August 1997, Seiten 44 bis 
49), die dynamisch rekonfigurierbar sind, jedoch nur 
partiell. Diese rekonfigurierbare Eigenschaft konnte 
man ausnutzen, indem in einem permanenten Teil 
h(u, v, c) und die Register zur FSM-Codierung sowie 
im nachladbaren Teil die aktuelle FSM geladen und 
ausgefuhrt werden. Das Problem hierbei ist der Per- 
formanceverlust beim Nachladen. Dies ist aus dem 
nachfolgenden Beispiei ersichtlich: 

Beispiel 

[0039] Die gern genommene StraSenverkehrsam- 
pel als Beispiel fur eine Finite State Machine kann 
auch sehr gut als Beispiel fur eine Sequential FSM 
genommen werden, wenn man an einen Nachtmo- 
dus denkt. Das Wort Modus zeigt schon den Weg: Im 
Umschalten zwischen einzelnen FSMs sollte so et- 
was wie ein Moduswechsel liegen, und Tag- und 



Nachtmodus schliefcen sich nun einmal gegenseitig 
aus. 

[0040] FSM1 integriert nun die Tagampel, FSM2 die 
Nachtampel (z.B. gelbes Blinken fur die Nebenstra- 
ften), und im ubergeordneten Sequencer wird an 
Hand eines Zeitsignals entschieden, welche FSM zur 
Ausfuhrung kommt und welche ruht. Der Sequencer 
wird als FSMO implementiert 
[0041] Die Beschreibung fur hierfur erforderliche 
drei FSM (0 .. 2) wird getrennt durchgefuhrt, dann 
aber auf einem PLD integriert, so dass im Bereich 0 
die FSMO, 1 FSM1 und 2 FSM2 liegen wurde. Ein 
Flachengewinn ware damit nicht zu verzeichnen. 
[0042] Im nachladbaren Fall mOsste FSMO perma- 
nent zur Verfugung stehen, au&erdem ein Bereich, 
der das Maximum von {FSM1, FSM2} aufnehmen 
konnte. In diesen Bereich ware dann standig eine von 
zweien geladen, und das Umschalten wurde eine Re- 
konfiguration nach sich Ziehen. 
[0043] Zur Verdeutlichung des Vorteils bei dyna- 
misch rekonfigurierbaren PLDs, wie sie Logikeinrich- 
tungen nach der Erfindung darstellen, wird die Ober- 
gangsfunktion f(u, x, c) (vgl. Figur 2) nunmehr als f c (u, 
x) (Aquivalentes gilt fur Funktion g) bezeichnet. Mit 
dieser Darstellung soli die Unterschiedlichkeit in der 
Abhangigkeit demonstriert werden: u und x bewirken 
eine standige, mit dem Takt verbundene Fortentwick- 
lung des Zustands der Maschine, wahrend c die Ab- 
hangigkeit vom wesentlich selteneren Moduswechsel 
beschreibt. 

[0044] Die Rekonfiguration selbst wurde vergleichs- 
weise viel Zeit in Anspruch nehmen; es wurde nun er- 
kannt, dass eine wesentlich gunstigere Losung in ei- 
ner erweiterten Architektur von PLDs besteht, in de- 
nen zugleich mehrere Programme dynamisch um- 
schaltbargespeichert sind. Eine entsprechende Logi- 
keinrichtung kdnnte als Multi-Plane-PLD bezeichnet 
werden; um jedoch dem Aspekt des jeweiligen „Kon- 
text" Rechnung zu tragen und darzustellen, dass 
auch nur Teilbereiche von Umschaltvorgangen be- 
troffen sind, wird hier der Name „Dynamical Mul- 
ti-Context PLDs (dMC-PLDs)" gewahlt. 

Abschnitt II ( ErfindungsgemaGe Architektur von „Dy- 
namical Multi-Context PLDs") 

[0045] Zunachst sei ein Problem angesprochen, 
dass sowohl fur klassische dynamisch rekonfigurier- 
bare als auch fur dMC-PLDs gilt. Wird namlich ledig- 
lich ein Teilbereich umgeschaltet, mOssen dessen 
Schnittstellen nach au&en hin, also insbesondere in 
Richtung der verbleibenden Teile, konstant bleiben. 
Zugleich sind einige Funktionsprogramme (soge- 
nannte „Routingressourcen") von dem Umschalten 
mit betroffen, da innerhalb des umzuschaltenden 
Blocks nicht nur Logik, sondern auch Verbindungen 
liegen mussen. 

[0046] Konsequenterweise wird im Folgenden fur 
die erfindungsgemaiJe Logikeinrichtung ein 
PLD-Block als eine rekonfigurierbare Einheit, beste- 
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hend aus logischen Verarbeitungseinheiten mit Rou- 
tingressourcen und Schnittstellen (sogenanntes 
..Routing") zu anderen Blocken definiert; diese Defini- 
tion stimmt mit den in der Praxis ublichen, partiell re- 
konfigurierbaren Bausteinen Oberein. Die Definition 
dieses Blocks weicht dabei von der ublichen Definiti- 
on der logischen BlOcke ab. 

[0047] Wenn man sich jetzt einmal einen fiktiven 
PLD mit solchen Bldcken anschaut, erhait man eine 
Architektur, wie sie aus Fig. 3 hervorgeht. In der Fi- 
gur sind bezeichnet mit 2 eine partiell rekonfigurier- 
bare PLD-Einrichtung bzw. -Struktur, mit 3A bis 3D 
vier PLD-BI6cke (= Logikblocke), mit 4 ein (globales) 
Routing, das eine Verarbeitungseinheit mit Funkti- 
onsprogrammen und Schnittstellen zu den Blocken 
bildet, sowie mit 5 ein l/O-Bereich, der Mittel zum Ver- 
knupfen der LogikblCcke mit der Verarbeitungseinheit 
und einer Ein-/und Ausgabeeinheit darstellt. Man 
kann sich diese Architektur so vorstellen, dass - ein- 
mal abgesehen von den l/O-Ressourcen 5 am Au- 
fcenrand - jeder PLD-Block 3A bis 3D einem vollwer- 
tigen CPLD (..Complex PLD") oder FPGA entspricht. 
Derartige Architekturen existieren bereits, z.B. „Cyp- 
ress Delta39k", „Lattice-Vantis Godfather'-Architek- 
tur; sie sind jedoch nicht im Betriebszustand der 
PLD-Einrichtung rekonfigurierbar. 
[0048] Bei der in Fig. 4 schematisch angedeuteten 
dMC-PLD-Architektur einer Logikeinrichtung 7 nach 
der Erfindung wird die PLD-Struktur 2 nach Fig. 3 
durch einen zusatzlichen PLD uberlagert. Dieser als 
Umschalt-Logikblock8 bezeichnete Extra-PLD ist bei 
bekannten Logikeinrichtungen nicht vorhanden und 
soil die Umschaltfunktion h(u, v, c) (vgl. Fig. 2) uber- 
nehmen. Er stellt folglich einen Teil von Verknup- 
fungsmitteln dar, mit denen die Konfiguration wenigs- 
tens einiger der Logikblocke 3A bis 3D untereinander 
und/oder mit der Verarbeitungseinheit 4 und/oder der 
Ein-/Ausgabeeinheit 5 erfolgt. Dies bedeutet, dass 
die AusgSnge in Fig. 4 einem gespeicherten Kontext 
c entsprechen und die Auswahl der aktuellen Funkti- 
onen f c (u. x) und g c (u, x) steuern. 
[0049] Fur diesen Extra-PLD ergibt sich damit eine 
Struktur, die aus vielen Eingangen (u, x) wenige, aus- 
schlieBlich gespeicherte AusgSnge berechnet. 
[0050] Die sich aus diesem Aufbau ergebenden 
Vorteile sind darin zu sehen, dass die funktionale 
Dichte und damit die Ausnutzbarkeit gesteigert wer- 
den bzw. die Kosten pro Anwendung zu senken sind. 
Folgende grobe Abschatzung kann dafur gegeben 
werden: 

Es sei angenommen, dass die Ausnutzung der ver- 
wendeten Transistoren 1:20 ist; d.h., von 20 einge- 
setzten Transistoren ist tatsSchlich nur einer in der 
(programmierbaren) logischen Funktion sichtbar. Fur 
den Extra-PLD 8 lassen sich 20 % Overhead veran- 
schlagen, da es sich urn einen Logikblock handelt, 
der nicht zur eigentlichen Funktionalitat beitragt, son- 
dern nur die anderen BIGcke 3A bis 3D umschaltet. 
Fur die Speicherung und Decodierung der zusatzli- 
chen Programme (es werden lediglich 4 gespeicherte 



Funktionen pro PLD-Block angenommen) werden 
weitere 6 Transistoren berechnet (4 Transistoren zur 
Speicherung und 2 zur Auswahl 1 aus 4). Daraus er- 
gibt sich eine neue Ausnutzung von 4:30, mithin eine 
Steigerung der Dichte gegenuber bekannten Ausfuh- 
rungsformen um 166 %. 

[0051] Gegebenenfalls kdnnte sich eine Schwierig- 
keit dadurch ergeben, dass sich auf Grund mehrerer 
Konfigurationen, aus denen eine aktuelle auszuwSh- 
len ist, der kritische Pfad innerhalb eines PLD-Blocks 
um einen Transistor verlSngern kann, was mit der Er- 
niedrigung der maximalen Taktfrequenz einhergehen 
wurde. Hierzu muss zwischen sogenannter 
SRAM-basierten Speicherung einerseits und soge- 
nannter FLASH-EEPROM bzw. Anti-Fuse anderer- 
seits unterschieden werden. 

[0052] FUr SRAM-basierte Verfahren wird mit der 
US 6,011,740 A ein Verfahren vorgeschlagen, die 
Speicherung mehrerer Konfigurationen in einem 
Schatten-RAM z.B. als Ringspeicher zu realisieren 
und die aktuell benotigte Information in eine Arbeits- 
zelle zu laden. Dieses Verfahren garantiert eine ma- 
ximale Arbeitsgeschwindigkeit. 
[0053] Fur Flash- und Antifuse-Speicherung konnte 
als eigentliche Zelle ebenfafls eine nachladbare 
SRAM-Zelle in Betracht kommen, so dass die oben- 
genannte Losung zum Tragen kommt; dies bedeutet 
jedoch einen zusatzlichen Aufwand und moglicher- 
weise eine Verringerung der Geschwindigkeit, be- 
dingt durch den Technologiewechsel bei der Spei- 
cherung. Bei diesen Technologien wird tatsachlich 
ein weiterer Path-Transistor, der den aktuellen Kon- 
text decodiert, im Pfad eingefuhrt, gegebenenfalls in 
Form von Dual-Gate-FETs. 

[0054] Die genaue Einteilung, welche BlockgroRe 
und Extra-PLD-Grdfce fur die Vielzahl an Anwendun- 
gen von Vorteil sind, kann durch Simulationen an Bei- 
spielen ermittelt werden. 

[0055] Zu einer Realisierung einer erfindungsgem§- 
fcen Logikeinrichtung nach Fig. 4 kann man sich vor- 
stellen, dass die beiden schematisch dargestellten 
Schichten, namlich die mit dem Extra-PLD 8 (= Um- 
schalt-Logikblock) und die mit den Logikblocken 3A 
bis 3D, jeweils in einer Ebene E2 bzw. E1 zumindest 
weitgehend Equivalent sind und sich nicht nur gegen- 
seitig umschalten, sondern vielmehr auch die Pro- 
grammierung des jeweils anderen Teils erzeugen. 
Umschaltung bedeutet in diesem Fall, dass zwischen 
vorbestimmten Programmen ausgewShlt wird. Ge- 
genseitige Programmierung hingegen kann zur An- 
passung (Evolution) an die jeweilige Umgebung ge- 
nutzt werden. Ein einfaches Beispiel kann eine digi- 
tale PLL sein, die eine Frequenz mittels Laufeeitef- 
fekten an einen Mastertakt anpasst. 

Patentanspruche 

1. Einrichtung der programmierbaren Logik 
- mit mehreren Logikbl6cken mit konfigurierbaren Ei- 
genschaften, die jeweils mindestens eine Verarbei- 
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tungseinheit mit Funktionsprogrammen und Schnitt- 
stellen zu den jeweils anderen Logikblticken umfas- 
sen, 

- mit mindestens einer den Logikblficken zugeordne- 
ten Ein-/Ausgabeeinheit, 

und 

- mit Mitteln zum Verknupfen der LogikblOcke 

a) untereinander, 

b) mit mindestens einer der Verarbeitungseinheiten 
eines anderen Logikblocks 

und 

c) mit der mindestens einen Ein-/Ausgabeeinheit, ge- 
kennzeichnet durch eine Rekonfigurierbarkeit der Lo- 
gikblocke (3A bis 3D) wahrend des gesamten Be- 
triebs der Logikeinrichtung (7) dadurch, dass die Ver- 
knupfungsmittel zusatzlich wenigstens einen konfigu- 
rierbaren Umschalt-Logikblock (8) aufweisen, mit 
dem eine Konfiguration wenigstens einiger der re- 
konfigurierbaren Logikblocke (3A bis 3D) selbst 
und/oder ihrer Verbindungen untereinander und/oder 
ihrer Verbindungen mit der mindestens einen Verar- 
beitungseinheit (4) und/oder ihrer Verbindungen der 
mindestens einen Ein-/Ausgabeeinheit (5) erfolgt, 
wobei der Umschalt-Logikblock (8) in einer Ebene 
(E2) ausgebildet ist, die von einer Ebene (E1) mit den 
rekonfigurierbaren LogikblOcken (3A bis 3D) ver- 
schieden ist. 

2. Einrichtung nach Anspruch 1, dadurch ge- 
kennzeichnet, dass die Ebenen (E1, E2) zumindest 
weitgehend Equivalent aufgebaut sind. 

3. Einrichtung nach Anspruch 1, dadurch ge- 
kennzeichnet, dass die Konfiguration wenigstens ei- 
niger der rekonfigurierbaren LogikblOcke (3A bis 3D) 
einem vorgegebenen Kontext (c) entsprechend er- 
folgt. 

4. Einrichtung nach einem der vorangehenden 
Anspruche, dadurch gekennzeichnet, dass der Um- 
schalt-Logikblock (8) wenigstens einen Zustands- 
speicher aufweist, der Informationen bezuglich der 
Funktionen der einzelnen rekonfigurierbaren Logik- 
blocke (3A bis 3D) enthSIt, und dass die Konfigurati- 
on der ausgewahlten rekonfigurierbaren Logikbldcke 
gemSIS den Funktionsinformationen des ausgewahl- 
ten Zustands erfolgt. 

Es folgen 3 Blatt Zeichnungen 
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Anhangende Zeichnungen 



FIG 1 3 Eingangsvektor 



Ausgangsvektor y 




"(t n+ i) 



FIG 1b x 



g(u, x) = u 




Speicherglieder 



u(t n+ i) 



FIG 1c x u(u ' x) = 9(u) 




Speicherglieder 
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1d 



u(u, x) = g(u, x) 




Speicherglieder 




FSM-Codierung 
(Register) 
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FIG 3 



5 (l/O-Bereich) 



3A 

(PLD-Block) 



3B 

(PLD-Block) 



4 [(Globa le s) Routing! 



3C 

(PLD-Block) 



3D 

(PLD-Block) 
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Abstract of DE1 0347975 



The logic device (7) has a number of logic 
blocks (3A-3D) with configurable 
characteristics, each having at least one 
processing unit with function programs and 
interfaces for connection with each other logic 
block, at least one of the logic blocks having 
an input/output unit. The configuration of the 
logic device is determined by a configurable 
switching logic block (8) provided in a different 
plane (E2) to the plane (E1) containing the 




logic blocks. 
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